红杉中国发布 xbench,首个由投资机构打造的 AI 基准测试
红杉中国发布 xbench,首个由投资机构打造的 AI 基准测试随着基础模型的快速发展和 AI Agent 进入规模化应用阶段,被广泛使用的基准测试(Benchmark)却面临一个日益尖锐的问题:想要真实地反映 AI 的客观能力正变得越来越困难。
随着基础模型的快速发展和 AI Agent 进入规模化应用阶段,被广泛使用的基准测试(Benchmark)却面临一个日益尖锐的问题:想要真实地反映 AI 的客观能力正变得越来越困难。
微软Build 2025全面转向AI Agent,整合OpenAI及xAI模型
Hi,我是银海。 你身边的AI产品经理,陪你解决每一个真实问题。 刚刚,前阵子很火的 AI Agent 概念工具 Manus,刚刚终于开放了全面注册。
硬氪获悉,近日新加坡人工智能金融科技公司RockFlow宣布完成1000万美元A1轮融资,由头部互联网公司创始人领投,老股东持续加注。本轮资金将用于进一步提升其人工智能技术和即将推出的金融AI Agent —— Bobby。
E2B 的愿景很大,CEO 的目标是成为 AI Agent 时代的 AWS,成为一个自动化的 infra 平台,未来可以提供 GPU 支持,满足更复杂的数据分析、小模型训练、游戏生成等需求,并可以托管 agent 构建的应用,覆盖 agent 从开发到部署的完整生命周期。
随着AI Agent 在工作场所日益普及,个人可能会与之紧密协作。波士顿咨询集团报告指出,未来五年内,AI Agent 市场预计将以45%的复合年增长率扩张。
00后 Kay Feng 再次创业创立Aha lab,用AI Agent 解决营销中广告主和网红创作者的精准匹配、建联和谈价格问题。获得Product hunt首日日榜冠军,并获得锦秋基金、金沙江创投(朱啸虎)的投资。
近期,大模型智能体(Agent)的相关话题爆火 —— 不论是 Anthropic 抢先 MCP 范式的快速普及,还是 OpenAI 推出的 Agents SDK 以及谷歌最新发布的 A2A 协议,都预示了 AI Agent 的巨大潜力。
经历了 2025 年初 DeepSeek、Manus 们的冲击,大厂正在重新明确自己下一步的战略。
AI Agent 领域也存在 scaling law,甚至还在加速。